数学概率统计50 参数假设检验的基本理论

假设检验的概念¶

为了推断总体的某些性质, 我们会提出总体性质的各种假设。假设检验就是根据样本提供的信息对所提出的假设作出判断的过程。

原假设是我们有怀疑, 想要拒绝的假设, 记为 $H_0$ 。备择假设是我们拒绝了原假设后得到的结论, 记为 $H_{s *}$。

假设都是关于总体参数的, 例如, 我们想知道总体均值是否等于某个常数 $\mu_0$, 那么原假设是 $H_0: \mu=\mu_0$, 则备择假设是 $H_0: \mu \neq \mu_0$ 。上面这种假设, 我们称为双尾检验, 因为备择假设是双边的。

下面两种假设检验称为单尾检验: $$ \begin{array}{ll} H_0: \mu \geqslant \mu_0 & H_u: \mu<\mu_0 \\ H_0: \mu \leqslant \mu_0 & H_u: \mu>\mu_0 \end{array} $$ 注意 : 无论是单尾还是双尾检验, 等号永远都在原假设一边, 这是用来判断原来假设的唯一标准。

第一类错误和第二类错误¶

我们在做假设检验的时候会犯两种错误: 第一, 原来假设是正确的而你判断它为错误的; 第二, 原来假设是错误的而你判断它为正确的。我们分别称为第一类错误和第二类错误。

第一类错误：原来假设是正确的, 却拒绝了原来假设;
第二类错误：原来假设是错误的, 却没有拒绝原来假设。这类似于法官判案时, 如果被告是好人.却判他为坏人. 这是第一类错误(错杀好人或以真为假)。如果被告是坏人, 却判他为好人, 这是第二类错误 (放走坏人或以假为真)。

在其他条件不变的情况下,如果要求犯第一类错误概率越小,那么犯第二类错误的概率就会越大, 通俗的理解是：当我们要求错杀好人的概率降低.那么隹往就会放走坏人。同样的, 在其他条件不变的情况下, 如果要求犯第二类错误概率越小, 那么犯第一类错误的概率就越大。通俗的理解即: 当我㐰要求放走坏人的概率降低, 那么往往就会错杀好人。*

其他条件不变主要指的是样本量 $n$ 不变。换言之, 要想减少犯第一类错误的概率和犯第二类错误的概率, 就要增大样本量 $n$ 。

在假设检验的时候, 我们会规定一个允许犯第一类错误的概率, 比如 $5 \%$, 这称为显著性水平, 记为 $\alpha_v$ 我们通常只规定犯第一类错误的概率, 而不规定犯第二类错误的概率。

检验的势定义为在原假设是错误的情况下正确拒绝原假设的概率。检验的势等于 1 减去犯第二类错误的概率。 我们用下表来表示衵著性水平性检验的势。

要做假设检验, 我们两样计算两样东西：检验统计量和关键值。

检验统计哩是从样本数据中计算得来的。检验统计量的一般形式为: 检验统计量 $=$ (样本统计量一在 $H_0$ 中假设的总体参数值) /样本统计量的标准误关键值是查表得到的。关键值的计算需要知道以下三点。

检验统计是是什么分布,这决定我们要去查哪张表;
显著性水平;
是双尾还是单尾检验。 ## 决策规则 ### 基于检验统计量和关键值的决策准则
计算检验统计量和关键值之后,怎样判断是拒绝原假设还是不拒绝原假设昵?

首先, 我们要搞清楚我们做的是双尾检验还是单尾检验。如果是双尾检验, 那么拒绝域在两边。以双尾 $Z$ 检验为例,首先画出 $Z$ 分布 (标准正态分布), 在两边画出黑色的拒绝区域。如图所示。拒绝区域的面积和等于显著性水平。以 $\alpha=0.05$ 为例, 左右两块拒绝区域的面积之和应等于 $0.05$, 可知交界处的数值为 $\pm 1.96$ 。 $\pm 1.96$ 即为关键值,

如果从样本数据中计算得出的检验统计量落在拒绝区域(小于-1.96 或大于 1.96), 就拒绝原假设; 如果检验统计量没有落在拒绝区域(在-1.96 和 $1.96$ 之间), 就不能拒绝原假设。

如果是单尾检验, 那么拒绝区域在一边。拒绝区域在哪一边, 要看备择假设在哪一边. 以单尾的 $Z$ 检验为例, 假设原假设为 $H_0: \mu \leqslant \mu_0$, 备择假设为 $H_\theta: \mu>\mu_0$, 那么拒绝区域在右边, 因为备择假设在右边。首先画出 $z$ 分布 (标准正态分布), 在右边画出黒色的拒绝区域。

拒绝区域的面积还是等于显著性水平。以 $\alpha=0.05$ 为例, 因为只有一块拒绝区域,因此其面积为 $0.05$, 可知交界处的数值为 $1.65 。 1.65$ 即为关键值。如果从样本数据中计算得出的检验统计量落在拒绝区域 (大于 $1.65$ ), 就拒绝原假设; 如果检验统计量没有落在拒绝区域(小于 1.65), 就不能拒绝原假设。

基于 $p$ 值和显著性水平的决策规则¶

在实际中, 如统计软件经常给出是 $p$ 值, 可以将 $p$ 值与湿著性水平作比较, 以决定拒绝还是不拒绝原假设,这是基于 $p$ 值和显著性水平的决策规则。

首先来看看 $p$ 值到底是什么。对于双尾检验, 有两个检验统计量, 两个统计量两边的面积之和就是 $p$ 值。因此,每一边的面积是 $p / 2$, 如图所示。对于单尾检验, 只有一个检验统计量, 检验统计量边上的面积就是 $p$ 值, 如图 8-4 所示。

计算 $p$ 值的目的是与显著性水平作比较。如果 $p$ 值小于显著性水平, 说明检验统计量落在拒绝区域, 因此拒绝原假设。如果 $p$ 值大于显著性水平, 说明检莶统计量没有落在拒绝区域,因此不能拒绝原假设。

$p$ 值的定义为：可以拒绝原假设的最小显著性水平。

结论的陈述¶

如果不能拒绝原假设, 我们不能说接受原假设, 只能说 “不能拒绝原假设” (can notreject $H_0$ 或 fail to reject $H_0$ ). 在作出判断之后,我们还要陈述结论。如果拒绝原假设,那么我们说总体均值显著地不相等。

参考资料

朱顺泉经济金融数据分析及其Python应用